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摘要 : [目的 /意义 ] 如 何 有 效 地 实现 对 智慧 城市 中 多 源 蜡 构 数据 融合 ,是 智慧 城市 必须 要 解决 的 核心 问 
题 。[ 方 法 /过 程 ] 在 界定 城市 数据 资源 体系 基础 上 ,提出 面向 语义 的 元 数据 模型 ,结合 用 户 需求 分 类 ,构建 基于 
多 源 数 据 的 智慧 城市 数据 融合 框架 。[ 结果 /结论 ] 以 智慧 城市 数据 运营 中 心 为 依托 ,提出 面向 智慧 城市 的 用 户 
数据 服务 推荐 实现 路 径 ;最 后 提出 智慧 城市 数据 融合 的 发 展 建议 :完善 智慧 城市 多 源 数据 融合 标准 ;积极 制定 


数据 开放 政策 ;探讨 个 人 数据 采集 与 存储 保护 方案 。 
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互 智慧 城市 在 城市 信息 化 基础 上 发 展 而 来 ,是 城市 
信息 化 的 高 级 形态 "。 八 部 委 联 合 印发 的 《关于 促进 
智 起 城市 健康 发 展 的 指导 意见 》 中 指出 “到 2020 年 , 建 
成 < 批 特色 鲜明 的 智慧 城市 ”"”。《 国 民 经 济 和 社会 
发 展 第 十 三 个 五 年 规划 纲要 了》 明确 指出 要 加 强 现代 信 
意 课 础 设施 建设 ,建设 智慧 城市 。《 新 型 智慧 城市 发 展 
报答 2017) 显 示 , 我 国 新 型 智慧 城市 建设 呈 集 群发 展 
态 手 ,2018 年 4 月 全 国 网 络 安全 和 信息 化 工作 会 议 上 ， 
习近平 总 书记 提出 要 推动 数字 化 ,大 数据 .人工 智能 深 
度 发 展 ,大 数据 的 应 用 为 智慧 城市 的 发 展 提供 了 强大 
的 蝎 术 保障 。 

目前 ,业界 对 智慧 城市 概念 的 界定 仍 未 统一 。 王 
远 将 智慧 城市 定义 为 :“ 以 新 一 代 信息 技术 为 基础 ， 
通过 对 城市 各 部 分 数据 进行 监测 .分析 和 利用 ,实现 对 
城市 生活 环境 的 透彻 感知 ,城市 资源 的 全 面 调控 城市 
方方面面 便捷 运作 、 人 和 城市 之 间 和 谐 共 赢 等 目标 的 
新 型 城市 形态 "2 。 李 重 照 认 为 智慧 城市 内 涵 包 括 信 
息 通 信 技 术 的 基础 性 作用 经 济 发展 和 鼓励 创新 .促进 
各 部 门 间 资 源 共 享 和 协同 作业 等 方面 ,国内 学 者 对 
智慧 城市 的 定义 阐释 虽 角 度 各 异 , 但 其 核心 理念 基本 
一 致 , 即 运用 新 一 代 信 息 技术 手段 ,将 城市 运行 核心 数 


要 此 


据 整合 起 来 ,为 公众 提供 智能 化 服务 。 

智慧 城市 是 多 学 科 融 合 的 新 兴 领 域 ,在 传统 城市 
科学 领域 ,多 数学 者 使 用 城市 运行 数据 ,识别 城市 功能 
区 域 . 分 析 城 市 交通 网 络 与 城市 居民 行为 建 模 等 ;在 计 
算 机 科学 领域 ,学 者 们 提出 以 数据 挖掘 、 处理 和 分 析 技 
术 为 核心 的 智慧 城市 技术 体系 框架 ;在 管理 学 领域 ,学 
者 们 侧重 智慧 城市 的 愿景 与 战略 目标 ”、 未 来 城市 发 
展 的 影响 分 析 '“ ;在 产业 界 ,重点 关注 智慧 城市 项 目 在 
公众 服务 .商业 与 能 源 领域 的 具体 项 目 研发 与 应 用 ” 。 
城市 范围 内 的 数据 包括 空间 时间 范围 内 的 数据 ,不 同 
的 数据 由 于 形式 与 结构 上 的 差异 ,可 能 处 理 的 方法 \ 标 
准 全 然 不 同 。 例 如 ,针对 交通 路 况 数 据 , 可 能 存在 路 面 
实时 监控 信息 , 微 博 的 路 况 报道 以 及 交通 事故 记录 表 。 
这 3 种 数据 虽 表 现形 式 不 同 ,但 阐述 的 是 相同 的 交通 
流量 问题 。 此 外 ,通过 调研 国内 智慧 城市 的 建设 情况 ， 
发 现 国内 智慧 城市 建设 大 部 分 均 是 依托 原 有 城市 信息 
化 建设 成 果 , 在 数据 共享 和 集成 方面 存在 一 定 技术 壁 
人 垒 和 共享 权限 问题 。 王 广 淆 通过 文献 综述 国外 智慧 城 
市 研究 现状 ,得 出 国外 智慧 城市 研究 更 多 关注 技术 进 
步 .数据 集成 与 融合 问题 ”。2018 年 国家 智慧 城市 标 
准 化 总 体 组 发 布 《智慧 城市 数据 融合 》 标 准 文件 ,该 标 
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准 规定 了 数据 采集 .组织 .互联 和 服务 的 概念 模型 与 数 
据 编码 规范 。 本 研究 在 厘清 城市 数据 资源 体系 基础 
上 ,提出 面向 语义 的 元 数据 模型 ,结合 用 户 需求 分 类 ， 
构建 基于 多 源 数据 的 智慧 城市 数据 融合 框架 ,提升 公 
众 在 城市 管理 中 的 参与 度 ,为 政府 .企业 等 提供 决策 支 
持 ,创新 智慧 城市 信息 服务 模式 。 
1 文献 综述 

城市 建设 基本 要 素 方面 ,学 者 大 多 围绕 城市 建设 
的 基本 要 素 进行 探讨 ,对 技术 问题 未 展开 讨论 。V. 
Gaba 从 系统 整合 的 角度 ,将 政府 .居民 社区 经济. 基 
础 设施 与 自然 环境 相 整 合 ” ,提出 智慧 城市 的 初步 杠 
架 。T.，Nam 等 认为 智慧 城市 的 根本 要 素 包括 人 、 技 术 
与 给 织 ” 。 霍 国庆 认为 信息 资源 管理 的 主体 为 政府 、 
企 炎 与 社会 。 陈 锐 认为 城市 运行 管理 的 主体 是 政 
府 部 门 , 服 务 对 象 是 政府 企业 和 个 人 5 。 
半 城市 数据 应 用 方面 ,学 者 们 构建 了 以 数据 挖掘 和 
分 丽 技 术 为 核心 的 智慧 城 市 技术 框架 ,以 在 此 基础 上 
提供 多 样 化 的 应 用 服务 。 例 如 潘 纲 教授 团队 提出 基于 
锁 通 数据 分 析 与 挖 气 的 智慧 城市 技术 框架 ,将 其 分 
汶 结 迹 感知 知识 发 现 和 具体 应 用 3 个 层次 ; 郑 宇 团队 
提 开 “四 层 反馈 ”结构 的 智慧 城市 技术 框架 ,包括 城市 
感知 与 数据 获取 ` 城 市 数据 管理 、 城 市 数据 分 析 应 用 
与 服务 "…“ 。 
;汉城 市 数据 融合 方面 ,学 者 从 不 同 角 度 构 建 了 智慧 
城市 数据 融合 框架 。 李 纲 研究 了 突 发 事件 应 急 信息 融 
合 : 提 出 以 突 发 事件 信息 为 基础 ` 以 服务 应 急 决策 为 目 
的 的 信息 融合 框架 "5 。 张 义 提出 城市 多 模式 数据 融 
合 的 理论 架构 ,包括 服务 信息 描述 模型 .元 数据 模型 和 
数据 互联 模型 " ,并 提出 智慧 城市 数据 共享 和 融合 框 
架 。 从 技术 实现 层面 ,有 基于 Web API 信息 集成 的 城 
市 数据 融合 框架 、 基 于 元 数据 的 城市 数据 融合 框架 、 基 
于 语义 聚合 的 城市 数据 融合 框架 :中 基于 Web API 的 
城市 数据 融合 框架 应 用 较 多 ,但 缺点 是 开放 接口 不 一 
致 ,特定 API 只 允许 访问 特定 数据 或 服务 ,不 能 实现 数 
据 之 间 的 互联 ,开发 者 需 针对 数据 进行 处 理 ,才能 开发 
具体 应 用 ;@ 基 于 元 数据 的 城市 数据 融合 框架 采用 统 
一 的 元 数据 标准 来 汇聚 城市 运行 数据 ,但 可 能 出 现 来 
自 不 同 数据 集 而 表示 的 是 城市 的 相同 实体 的 情况 , 忽 
视 了 实体 之 间 的 语义 关系 和 相应 匹配 关系 ;@ 基 于 语 
义 聚 合 的 城市 数据 融合 框架 利用 特定 领域 本 体 "” (如 
Km4City) ,从 城市 运营 商 收集 数据 ,将 具有 内 在 语义 联 
系 的 数据 进行 聚合 ,使 其 集成 在 统一 的 .语义 上 互 操作 


的 基于 多 领域 本 体 的 模型 中 。 


城市 数据 资源 体系 是 以 地 理 空间 数据 为 统一 载 
体 , 依 据 城市 时 空 范围 内 各 领域 数据 的 内 在 关系 ,对 其 
进行 整合 形成 的 复杂 系统 。 政 府 \ 企 业 、 公 众 是 智 芒 城 
市 的 主体 ,从 系统 的 角度 ,以 地 理 空间 数据 为 根基 , 构 
建 基于 城市 主体 的 智慧 城市 数据 资源 体系 ,如 图 1 所 
不 : 


基础 地 理 信息 要 素数 据 


1 城市 数据 资源 体系 


图 1 中 的 城市 数据 资源 体系 包括 :中 基础 地 理 信 
息 要 素数 据 。 指 与 地 理 位 置 相关 的 数据 ,是 信息 标准 
化 处 理 的 空间 数据 依据 ,包括 影像 图 .矢量 图 与 地 
形 图 等 。 在 国家 标准 《GBT13923 - 2006 基础 地 理 信 息 
要 素 分 类 与 代码 》 基 础 上 ,部 分 城市 结合 本 市 城市 规划 
和 城市 基础 测绘 等 特点 ,制定 具有 地 方 特色 的 数据 标 
准 ,丰富 城市 基础 地 理 信息 要 素 内 容 。@ 政 府 数据 。 
是 产生 于 政府 内 部 或 外 部 ,对 政府 活动 .公共 事务 、 公 
众生 活 与 城市 运行 有 影响 的 数据 资源 的 总 称 ” ,包括 
法 律 法 规 .政策 文件 部门 报告 .公共 注册 信息 、 环 境 与 
气象 信息 .科研 数据 库 与 统计 资料 汇编 等 数据 ”' ,来 
自 应 急 交通、 公安 环保 ` 气象 ,水务 等 政府 部 门 。@@) 
企业 数据 。 指 与 企业 经 营 相 关 的 数据 ,包括 在 产品 研 
发 设计 制造 .营销 ,资金 流转 等 各 个 环节 形成 的 数据 。 
@ 人 公众 数据 。 即 在 日 常生 活 中 ,个 人 产生 的 手机 数据 、 
LBS 位 置 服务 数据 与 客流 数据 等 ,这 些 社会 活动 数据 
描绘 了 用 户 的 活动 模式 。 手 机 数据 包括 通话 记录 、 
GPS 定位 信息 与 上 网 记录 等 ;LBS 位 置 服务 数据 能 够 
获取 移动 终端 用 户 的 位 置信 息 , 是 对 POI 数据 的 补充 ; 
客流 数据 包含 城市 人 口 的 活动 信息 。 


3 面向 语义 的 智慧 城市 元 数据 模型 
元 数据 是 描述 某 种 类 型 资源 属性 的 结构 化 数据 ， 
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标准 化 的 智慧 城市 元 数据 模型 是 实现 城市 各 应 用 系统 
之 间 互 操作 的 基础 ,可 以 解决 异 构 数据 转换 ,实现 同一 
主题 的 资源 聚合 ,为 城市 决策 者 提供 数据 服务 。 元 数 
据 服 务 提供 者 主要 为 数据 生产 者 和 拥有 者 ,将 元 数据 
服务 发 布 到 城市 的 UDDI 注册 中 心 ”。 本 研究 定义 元 


数据 模型 为 六 元 组 MD = |S,E,A ,I, R,C} 1。 
(1 ) 数 据 源 S(Source)。 数 据 源 是 来 自 教育 局 交通 


运输 局 .卫生 局 .税务 局 .住房 和 建设 局 .公安 局 .民政 
局 .气象 局 .水 务 局 等 部 门 的 数据 。 数 据 源 集合 表示 为 
= |S,,S,,…,S,| ,其 中 Si(1 <i<n) 表 示 第 i 个 数据 源 。 

(2 ) 实体 类 和 集合 下 ( Entity Type) 。 拥 有 相同 属性 
的 实体 集 的 总 称 。 实 体 类 包括 人 .物体 与 时 空 实体 。 
人 (Agent) 是 政府 .企业 和 公众 的 统称 , 指 能 自主 活动 
的 数据 持 有 者 ;物体 类 (Object) 包括 自然 地 理 实体 (如 
IE 河流 .湖泊 等 ) 和 人 工 建造 的 地 理 实体 (如 建筑 物 、 


1 桥梁 、 0 ; 实体 ( ee ee Enti- 


J 


息 \ 空 气质 量 监测 信息 和 天 气 状 况 等 。 如 图 2 所 示 : 
3 Entity 
CD 
A | Agent ] Object | [TemporalSpatialEntity ] 
A 入 
Ea ment ] Enterprise ] Person | Road (Mountain | [Building] | Place ] TemporalThing ] 


图 2 实体 的 分 类 体系 示例 


属性 A。 实 体 属 性 集合 A = 
a 
bn 以 感知 设备 为 例 ,感知 设备 是 指 能 实时 感知 
外 界 信息 的 变化 ,并 将 获取 的 信息 传递 给 其 他 装置 的 
物理 设备 ,例如 传感器 、GPS 定位 设备 ,视频 监控 设备 
与 射频 识别 设备 等 ,其 实体 属性 如 表 1 所 示 : 

表 1 感知 设备 实体 属性 ™) 


| an al， ， 


类 别 属性 名 称 备注 

感知 设备 属性 实体 名 称 无 
唯一 编码 无 
其 他 编码 在 其 他 应 用 系统 中 存在 的 编码 
类 别 码 所 属 分 类 
业务 信息 无 
位 置信 息 包括 位 置 描述 .坐标 类 型 坐标 单位 等 
责任 部 门 无 

管理 对 象 编码 无 

是 否 固定 是 否 固 定 在 某 个 位 置 
设备 用 途 用 来 感知 的 内 容 描述 
感知 频率 采集 信息 的 最 小 时 间 间 隔 


(4) 实 例 集 I。 是 实体 类 对 象 集合 。 实 体 是 现实 
世界 存在 的 、 可 识别 的 对 和 象 ,实例 类 集合 表示 为 I= 
L,D,,…,1,| ,其 中 (1<i<m) 表 示 第 i 个 实体 。 

(5 ) 实 例 之 间 的 二 元 语义 关系 尺 。 根 据 PAS182 智 
慧 城 市 数据 互 操 作 的 概念 模型 ,总 结 数据 实体 对 象 之 
间 的 语义 关系 如 表 2 所 示 , 包 括 层 次 相关 、 概 念 相 关 、 
物理 相关 空间 相关 功能 相关 与 业务 相关 ,实体 类 对 
象 之 间 的 关系 均 能 通过 基础 数据 与 语义 关系 来 描述 。 
例如 contain 描述 实例 之 间 的 包含 关系 ,长 春 市 政府 包 
括 朝 阳 区 政府 、 南 关 区 政府 、 二 道 区 政府 、 宽 城区 政府 


和 绿 园 区 政府 等 。 
表 2 实体 之 间 的 语义 关系 
关系 表述 释义 
层次 相关 part of 部 分 与 整体 的 关系 
kind of 继承 关系 
概念 相关 A Subconcept of B A 是 B 的 子 概念 
owned by A 为 B 所 有 
物理 相关 contain A 包含 B 
raised from 起 产生 于 B 
influenced by A 被 B 影 响 
A about B A 关于 B 
has role in A 是 B 的 一 个 角色 
空间 相关 AatB A 在 B 位 置 
功能 相关 has A 具有 B 
implements A 实现 B 
provided by A 由 B 提供 
业务 相关 records A 记录 B 
coordination A 协调 B 
monitor A 监控 B 
integration A 集成 B 
procurement A 采购 B 
configuration A 配置 B 
operation A 操作 B 


(6) 情 境 C( Context)。 其 主要 表达 实体 所 处 的 天 
气 环 境 现场 情景 与 背景 信息 。 情 境 关 系 能 有 效 解 决 
数据 冲突 问题 ” ,从 不 同 数据 源 (Source) 获取 的 实体 
属性 (Entity Attribute) ,经 过 情境 确认 能 代表 同一 个 实 
体 ,从 而 提高 数据 融合 质量 。 如 图 3 所 示 , 在 情境 C,、 
Cs、C3\C4 与 C; 中 ,数据 源 S,、S; 与 S; 被 抽取 出 来 实 
体 属性 a 与 a ,而 后 被 认为 其 实体 属性 ai 与 az 属于 
同一 实体 。, 。 


4 构建 基于 多 源 数据 的 智慧 城市 数据 


融合 框架 
4.1 智慧 城市 用 户 需求 分 类 


4.1.1 Kano 用 户 需求 分 类 模型 ”Kano 模型 将 需求 划 
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Entity Attribute Entity 


3 数据 源 、 实 体 、 实 体 属性 及 情境 之 间 的 关系 


分 为 5 种 类 型 ,包括 基本 型 需求 .期 望 型 需求 . 撤 力 型 
需求 .无 差异 型 需求 与 反 向 型 需求 ,四 基本 型 需求 , 即 
用 户 对 产品 的 基本 要 求 。 当 该 需求 满足 或 超出 用 户 期 
户 时 ,用 户 不 一 定 会 因此 而 感到 满意 ,但 当 访 需求 不 消 
足 期 户 时 ,用 户 肯定 会 不 满意 。 加 期 望 型 需求 , 指 用 户 
满 富 度 与 需求 的 满足 程度 成 正比 关系 的 需求 。 若 此 类 
ee 
下 5 北 用 户 不 会 过 分 期 望 的 需求 。 当 魅力 型 需求 被 满 
,用 户 会 表现 出 较 高 的 满意 度 ;没有 购 力 型 需求 ， 
也 不 会 不 满意 。 图 无 差异 型 需求 ,是 不 论 提供 与 
本 对 用 户 体验 或 满意 度 无 影响 的 需求 。@@ 反 向 型 需 
臣 音 能 引起 强烈 不 满 或 导致 低 水 平 满意 度 的 质量 特 
性 Si 访 需求 会 导致 用 户 满意 度 下 降 。 如 图 4 所 示 ， 


V 


chinaX 


4 ”Kano 需求 分 类 


4.1.2 基于 Kano 智慧 城市 用 户 需 求 分 类 ”政府 是 智 
昔 城 市 的 运行 管理 者 ,公众 是 智慧 城市 管理 和 服务 的 
对 象 。 城 市 发 展 动力 是 用 户 的 需求 ” ,用 户 的 需求 和 
反馈 不 能 忽视 ,满足 用 户 需 求 是 建设 智慧 城市 的 关键 。 
而 用 户 需 求 是 动态 的 、 多 方面 的 \ 不 确定 的 ,上 且 智慧 城 
市 涵盖 众多 领域 的 具体 应 用 ,很 难 精准 描述 其 具体 需 
求 。 利 用 Kano 模型 ,并 结合 用 户 个 体 生命 周期 的 5 个 
阶段 ,包括 婴儿 期 ,儿童 期 .青春 期 .成 年 期 与 老年 期 ， 
逐步 细 化 后 得 到 具有 不 同 功能 属性 的 需求 组 ( 见 图 
5) ,开发 覆盖 于 不 同行 业 领域 的 具体 产品 ,包括 智慧 教 
育 相 关 产 品 .智慧 医疗 相关 产品 .智慧 交通 相关 产品 与 
智慧 社区 相关 产品 等 。 


CC 7 无 差异 需求 子 需求 
( 〇 ”期望 需 求 子 需求 
(CC_) 基本 需求 子 需求 
区 到 魅力 需求 子 需 求 


图 5 基于 Kano 的 用 户 需 求 分 类 
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4.2 多 源 数 据 的 智慧 城市 数据 融合 框架 构建 

智慧 城市 的 数据 服务 主体 是 政府 \ 企 业 、 公 众 。 智 
慧 城 市 数据 融合 框架 主要 目标 :从 微观 层面 来 看 ,通过 
对 基础 地 理 信息 数据 、 政 府 、 企 业 和 个 人 数据 的 收集 、 
处 理 与 分 析 ,能 够 实现 与 情 监控 预警 监测 与 问题 定位 
等 ;从 中 观 层面 来 看 ,建立 城市 数据 融合 平台 ,主动 推 
送 智 芒 城 市 相关 数据 服务 ,实现 惠 民 服务 与 城市 精准 
治理 ;从 宏观 层面 来 看 ,对 于 城市 各 项 政策 的 制定 具有 
重要 意义 。 因 此 ,采用 基于 大 数据 技术 的 分 布 式 存储 
结构 ,提出 构建 基于 公众 信息 服务 平台 、 政 务 专 网 信息 
交换 平台 ,企业 信息 服务 平台 与 空间 定位 信息 平台 一 
体 化 的 数据 融合 框架 ,如 图 6 所 示 : 


ydyJTYTOOZ 


Shell 脚本 或 API 从 数据 库 或 网 站 上 获取 数据 ,使 非 结 
构 化 数据 和 半 结 构 化 数据 转换 成 结构 化 数据 ,并 将 其 
存储 为 统一 的 本 地 文件 数据 。Flume 作为 分 布 式 实时 
日 志 采 集 系 统 ,用 于 抓 取 不 同 服务 器 上 的 海量 日 志 信 
息 ,并 将 其 推送 至 Kafka 分 布 式 消息 管理 系统 。 
(2) 数 据 存储 。 包 括 离 线 数据 存储 和 实时 数据 存 
嵌 。 离 线 数 据 存 储 使 用 HDFS 或 HBase 存储 离线 采集 
的 数据 。 实 时 数据 存储 采用 Redis 或 kafkaserver. redis 
分 布 式 NoSQL 数据 库 , Redis 作为 缓存 数据 库 ,供用 户 
存储 流 式 数据 ;Kafka server 主要 是 存储 Kafka 采集 过 
来 的 数据 。 

针对 非 实 时 结构 化 数据 ,例如 城市 地 理 信息 数据 ， 
该 类 数据 具有 固定 的 表 结 构 ,一 般 使 用 SQL 查询 ,将 其 
存储 在 Hive 数据 库 中 。 针 对 实时 数据 ,例如 城市 道路 
车 辆 实时 运行 数据 ,采集 速率 为 秒 级 ,事件 日 志 类 突 发 
性 强 的 数据 ,此 类 数据 对 数据 吞吐 性 能 要 求 较 高 , 且 访 
问 方 式 较为 单一 ,一 般 按 时 间 序 列 和 对 象 四 ,采用 刍 
值 对 方式 存放 在 HBase 数据 库 中 。 针 对 半 结 构 化 数 
据 , 例 如 视频 和 图 像 , 则 以 文件 形式 存放 在 HDFS 分 布 
式 文件 系统 中 。 

(3) 数 据 调 度 。 数 据 调度 层 主 要 是 0ozie 任务 调 
度 和 Zookeeper。0Oozie 用 于 管理 与 组 织 Hadoop 工作 流 
调度 工具 。Zookeeper 是 分 布 式 应 用 程序 协调 工具 , 存 
储 各 个 组 件 的 重要 信息 ,用 于 Kafka 和 Storm 之 间 的 协 
调 管 理 。Hue 是 Hadoop 生态 圈 中 的 可 视 化 工具 ,利用 
此 工具 能 查看 大 数据 中 各 个 组 件 的 运行 状态 。 

(4) 数 据 共享 。 应 用 数据 中 心 为 公共 信息 服务 平 
台 和 政务 专 网 信息 交换 平台 共享 处 理 后 的 数据 。 


图 6 基于 多 源 数据 的 智慧 城市 数据 融合 框架 


结合 用 户 需 求 分 类 ,按照 企业 级 大 数据 技术 框架 ， 
将 智慧 城市 数据 融合 框架 的 具体 实现 分 为 4 个 步骤 : 

(1 ) 数 据 采集 。 主 要 数据 源 包括 基础 地 理 信息 数 
据 、 政 府 数据 、 企 业 数据 与 公众 数据 等 。 数 据 采集 过 程 
包括 离线 采集 和 实时 采集 :中 离线 采集 有 SQL 采集 适 
配 和 Sqoop 采集 两 种 方式 。SQL 采集 适 配 主要 是 通过 
SQL 方式 来 采集 数据 库 的 数据 。Sqoop 作为 Hadoop 和 
关系 数据 库 之 间 传 输 数 据 的 工具 ,可 将 关系 数据 库 管 
理 系 统 中 的 数据 导入 到 Hadoop 分 布 式 文件 系统 HDFS 
中 ,在 Hadoop MapReduce 框架 下 完成 数据 转换 任务 ， 


YARN 通用 资源 管理 系统 ,可 为 数据 应 用 提供 统一 的 
资源 管理 和 调度 服务 ,能 提升 集群 服务 器 的 利用 率 。 
查询 数据 中 心 主 要 是 由 HBase .phoenixz 和 YARN 等 组 
成 ,通过 这 些 组 件 组 合 能 够 提高 大 数据 查询 速度 。 
通过 上 述 4 个 步骤, 智 意 城 市 数据 融合 框架 实现 
了 以 下 功能 :通过 融合 各 类 政府 数据 ,建立 大 数据 决 
策 分 析 模 型 ,对 海量 数据 进行 时 间 序 列 分 析 趋势 预测 
等 , 既 可 以 增强 城市 管理 与 规划 、 突 发 事件 预警 能 
又 为 政府 制定 政策 提供 数据 导向 。@) 通 过 整合 不 同 来 
源 .不 同类 型 的 企业 内 外 部 数据 ,了 解 市 场 动态 与 技术 
前 沿 ,为 企业 的 科学 运营 与 决策 提供 数据 支撑 。@) 为 
公众 提供 教育 交通、 医疗 与 旅游 等 方面 的 数据 推荐 服 
务 。 外 进行 城市 数据 可 视 化 分 析 。 将 二 维 地 图 .三 维 


进而 为 数据 融合 提供 基础 数据 源 ;@ 实 时 数据 采集 采 
用 的 是 脚本 采集 和 Flume 方式 。 脚 本 采集 主要 是 通过 
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实景 .视频 等 数据 与 政府 数据 \ 企 业 数据 、 公 众 数 据 融 
合 在 同一 时 空 体系 中 ,建立 时 空 多 维 城市 管理 系统 , 进 
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而 实现 实时 的 、 直 观 的 可 视 化 城市 管理 模式 ,提高 城市 
精细 化 治理 能 
4.3 面向 智慧 城市 的 用 户 数据 服务 推荐 实现 路 径 
以 多 源 数据 融合 框架 为 基础 ,建立 智慧 城市 数据 
运营 中 心 ,负责 城市 生活 中 的 大 数据 的 采集 、 管 理 和 志 
享 ,建立 城市 范围 内 多 部 门 合作 的 范式 ,能 改善 政府 前 
门 横向 协作 不 充分 现状 。 以 智 站 城市 用 户 需 求 分 类 为 
基础 ,再 结合 人 口 统计 属性 、 使 用 行为 俩 好 等 数据 , 构 
建 智慧 城市 用 户 需 求 画像 ,进而 提供 特定 的 数据 推荐 


FF 


服务 。 图 7 阐释 了 3 条 用 户 数据 推荐 服务 的 实现 路 
径 :中 路 径 1 是 将 用 户 需求 信息 与 智慧 城市 相关 知识 
库 进 行 粗 粒 度 匹配 ,向 用 户 提供 智慧 城市 相关 服务 ;@) 
路 径 2 是 将 用 户 需求 语义 信息 与 从 智 意 城市 知识 库 中 
抽取 出 的 知识 单元 进行 细 粒 度 匹配 ,对 知识 单元 进行 
多 维度 数据 融合 ,向 用 户 提供 面向 内 容 的 的 数据 推荐 
服务 ;@) 路 径 3 是 研究 如 何 向 资源 拥有 者 和 服务 提供 
者 开放 数据 接口 ,根据 用 户 需 求 画 像 ,对 其 提供 相应 的 
数据 服务 。 


ai 


有 


日 


)444V1 


发 展 建议 
大 束 城市 数据 融合 框架 设计 作为 技术 研究 工作 的 
局 设计 ,对 于 构建 智慧 城市 大 数据 管理 分 析 平台 至 
a 此 外 , 需 相关 部 门 的 积极 配合 ,更 好 地 为 公众 
所 江 数 据 推荐 服务 。 
5. 2> 完善 智慧 城市 多 源 数据 融合 标准 ,加 快 城市 化 、 
总 担 化 和 标准 化 的 协同 发 展 
(5 智慧 城市 建设 需要 城市 化 ,数据 化 和 标准 化 的 协 
同 发 展 。《 国 家 新 型 城镇 化 规划 (2014 - 2020 年 )》 提 
出 术 加快 推进 智慧 城市 建设 。 在 大 数据 环境 下 , 物 联 
网 ` 云 计算 和 传 感 技术 将 城市 范围 内 流转 的 信息 转变 
成 数据 ,被 赋予 了 数据 的 属性 ,因而 呈现 城市 数据 化 的 
发 展 态势 。《 智 慧 城市 数据 融合 ) 标 准 文件 中 编写 了 
数据 编码 规范 数据 采集 规范 与 市 政 基础 设施 数据 元 
素 规范 ,在 该 标准 的 基础 上 ,应 进一步 完善 智慧 城市 多 
源 数据 融合 标准 ,包括 实体 数据 标准 化 ,实体 属性 标准 
化 与 应 用 情境 标准 化 ,建立 数据 转换 标准 与 存储 规范 ， 
实现 跨 领 域 . 跨 部 门 跨 层级 的 数据 融合 。 见 图 8。 
5.2 ”政府 积极 制定 数据 开放 政策 ,建立 数据 共享 平台 
多 方 合作 机 制 
政府 制定 数据 开放 政策 ,明确 可 开放 数据 范围 

作为 数据 提供 方 ,在 符合 政策 规定 前 提 下 ,应 尽量 提供 
原始 数据 共享 服务 ,保证 数据 字段 的 完整 性 ;作为 数据 
接收 方 ,在 合理 使 用 数据 的 前 提 下 , 仍 负 有 保证 信息 安 
全 的 责任 。 政 府 提供 决策 优化 支持 ,高 校 提供 智力 服 


O 


智慧 城市 数据 需求 
运营 中 心 === ya 语义 网 络 


| es 
| 政 径 1 | 
智慧 城市 
相关 知识 库 
路 径 3 资源 拥有 者 
| 服务 提供 者 
城市 化 
人 城市 标准 化 
Me 村 智慧 城市 标准 体系 
”本 
A 
Sa 
六 x | 
本 : 
Ey 二 一 > 标准 化 


智 划 城 市 数据 球 准 体系 ,条 大 城市 多 源 数 所 融合 标准 体系 


数据 标准 化 
8 ”城市 化 数据 化 与 标准 化 协同 发 展 


务 支持 ,企业 提供 技术 与 产品 支持 ,建立 利益 相关 方 合 
作 关 系 的 数据 共享 机 制 。 
5.3 ”探讨 个 人 数据 采集 与 存储 保护 方案 ,鼓励 市 民 参 
与 智慧 城市 建设 

个 人 数据 是 个 人 生活 状况 的 真实 反映 ,涵盖 了 衣 
食 住 行 等 敏感 信息 。 近 年 来 个 人 隐私 泄露 事件 频 发 ， 
造成 了 个 人 数据 隐私 的 恕 慌 , 由 此 产生 的 “寒蝉 效应 ” 
可 能 会 让 公众 仿 于 共享 个 人 数据 。 因 此 ,研究 智慧 城 
市 数据 采集 与 存储 保护 方案 势 在 必 行 。 智 慧 城市 的 建 
设 应 该 广泛 征求 市 民 的 意见 ,如 荷兰 阿姆斯特丹 将 智 
茵 城市 应 用 功能 设计 外 包 给 市 民 去 完成 ,市 民 以 社区 
或 小 组 的 形式 完成 设计 方案 的 撰写 甚至 应 用 的 初步 开 
发 ,我国 可 借鉴 该 模式 ,鼓励 市 民 直 接 参加 智慧 应 用 的 
开发 ,为 市 民 提 供 满 足 市 场 需求 的 智慧 城市 服务 。 
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Abstract: [Purpose/significance | How to effectively realize data fusion of multi-source heterogeneous data in smart 


city is the core problem that intelligent city must solve. [Method/process | Based on the definition of urban data resource 


system, a semantic -oriented metadata model is proposed, and a framework of intelligent urban data fusion based on multi 


-source data is constructed according to user needs. [ Result/conclusion | Based on the intelligent city data operating cen- 


ter, this paper proposes the implementation path of user data service recommendation for intelligent city. Finally, it puts 


forward some suggestions for the development of intelligent city data fusion: improving the multi-source data fusion stand- 


ard of intelligent city; actively formulating the data opening policy; and exploring the personal data collection and storage 


protection scheme. 


Keywords: intelligent city data fusion 


12 


metadata 


user requirement 


